Mesure formelle de la robustesse des règles d'association
نویسندگان
چکیده
Résumé. Nous proposons dans cet article une définition formelle de la robustesse pour les règles d’association, s’appuyant sur une modélisation que nous avons précédemment définie. Ce concept est à notre avis central dans l’évaluation des règles et n’a à ce jour été que très peu étudié de façon satisfaisante. Il est crucial car malgré une très bonne évaluation par une mesure de qualité, une règle peut être très fragile par rapport à des variations légères des données. La mesure de robustesse que nous proposons dépend de la mesure de qualité utilisée pour évaluer les règles et du seuil d’acceptation minimal. Il est alors possible à partir de ces deux seuls éléments et de la valeur prise par la règle sur la mesure d’évaluer sa robustesse. Nous présentons plusieurs propriétés de cette robustesse, montrons sa mise en œuvre et illustrons celle-ci par les résultats d’expériences sur plusieurs bases de données pour quelques mesures. Nous donnons ainsi un nouveau regard sur la qualification des règles.
منابع مشابه
Un critère Bayésien pour évaluer la robustesse des règles de classification
Résumé. L’utilisation de règles de classification dans les modèles prédictifs a été très étudiée ces dernières années. La forme simple et interprétable des règles en font des motifs très populaires. Les classifieurs combinant des règles de classification intéressantes (selon une mesure d’intérêt) offrent de bonnes performances de prédictions. Cependant, les performances de ces classifieurs dépe...
متن کاملSous-bases k-faibles pour des règles d'association valides au sens de la confiance
L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart d...
متن کاملPCAR : nouvelle approche de génération de règles d'association cycliques
Résumé. Les règles d’association cycliques vise la découverte de nouvelles relations entre des produits qui varient d’une façon régulièrement cyclique dans le temps. Dans ce cadre, nous introduisons, un nouvel algorithme nommé PCAR caractérisé par sa performance et son aspect incrémental. L’étude empirique que nous avons menée montre la robustesse et l’efficacité de notre algorithme proposé vs....
متن کاملCritère VT100 de sélection des règles d'association
Résumé. L’extraction de règles d’association génère souvent un grand nombre de règles. Pour les classer et les valider, de nombreuses mesures statistiques ont été proposées ; elles permettent de mettre en avant telles ou telles caractéristiques des règles extraites. Elles ont pour point commun d’être fonction croissante du nombre de transactions et aboutissent bien souvent à l’acceptation de to...
متن کاملRègles d'association avec une prémisse composée : mesure du gain d'information
La communauté de fouille de données a développé un grand nombre d’indices permettant de mesurer la qualité des règles d’association (RA) selon diverses sémantiques (Guillet, 2004). Cependant ces sémantiques, qui permettent d’interpréter les règles simples, s’avèrent d’utilisation trop complexe pour un expert dans le cas de règles à prémisse composée. Notre objectif est donc de sélectionner les ...
متن کامل